宇宙条为何这么牛逼?今日头条核心技术架构解析(建议收藏)
作者丨钟镇刚
来源丨blog.csdn.net/mucaoyx/article/details/84498468
图片来自网络
上一篇:支付宝的架构到底有多牛逼?还没看完我就跪了!(万字长文,建议收藏)
今日头条创立于2012年3月,到目前仅4年时间。从十几个工程师开始研发,到上百人,再到200余人。产品线由内涵段子,到今日头条,今日特卖,今日电影等产品线。
一、产品背景 今日头条是为用户提供个性化资讯客户端。下面就和大家分享一下当前今日头条的数据(据内部与公开数据综合):5亿注册用户 2014年5月1.5亿,2015年5月3亿,2016年5月份为5亿。几乎为成倍增长。 日活4800万用户 2014年为1000万日活,2015年为3000万日活。 日均5亿PV 5亿文章浏览,视频为1亿。页面请求量超过30亿次。 用户停留时长超过65分钟以上
Scribe Flume Kafka
Hadoop Storm
1 用户订阅
2 标签
3 部分文章打散推送
3、新用户的“冷启动”
关注、粉丝关系 关系 用户标签
除了手机硬件,今日头条还会对用户安装的APP进行分析。例如机型和APP结合分析,用小米,用三星的和用苹果的不同,另外还有用户浏览器的书签。头条会实时捕捉用户对APP频道的动作。另外还包括用户订阅的频道,比如电影,段子,商品等。
自动候选 自动匹配用户,如用户地址定位,抽取用户信息 自动生成推送任务
自动选择候选文章 根据用户站内外动作
头条的频道,在技术侧划分的包括分类频道、兴趣标签频道、关键词频道、文本分析等,这些都分成相对独立的开发团队。目前已经有300+个分类器,仍在不断增加新的用户模型,原来的用户模型不用撤消,仍然发挥作用。
在还没有推出头条号时,内容主要是抓取其它平台的文章,然后去重,一年几百万级,并不太大。主要是用户动作日志收集,兴趣收集,用户模型收集。
资讯App的技术指标,比如屏幕滑动,用户是不是对一篇都看完,停留时间等都需要我们特别关注
6、消息推送
频率个性化 内容个性化 地域 兴趣
通道,首先速度要快,但是要可控,可靠,并且节省资源 推送的速度要快,有不同维度的策略支持,可跟踪,开发接口要友好 推送运营的后台,反馈也要快,包括时效性,热度,工具操作方便 对于运营侧,清晰是否确定推荐,包括推送的文案处理
推送系统一部分使用自有IDC,在发送量特别大,消耗带宽较严重。可以使用类似阿里云的服务,可有效节省成本。
二、今日头条系统架构
三、头条微服务架构
四、今日头条的虚拟化PaaS平台规划
五、总结
架构师交流群
「顶级架构师」建立了读者架构师交流群,大家可以添加小编微信进行加群
扫描添加好友邀你进架构师群,加我时注明【姓名+公司+职位】
版权申明:内容来源网络,版权归原作者所有。如有侵权烦请告知,我们会立即删除并表示歉意。谢谢。
猜你还想看
12306 的架构到底有多牛逼?
35岁是道坎?在阿里,40岁的奋斗姿势
阿里架构师:为什么大部分人做不了架构师?这2点是关键
想做架构师必看:关于架构师你需要知道的14件事!
长按识别图片二维码关注,订阅更多精彩
顶级架构师,企业架构、系统架构、网站架构、大规模分布式架构、高可用架构等架构讨论,以及结合互联网技术的架构调整。欢迎有想法、乐于分享的架构师交流学习。